数据很强大,甚至能够让人走火入魔,陷入过度分析的渊薮。但实际上,更多时候我们还是基于早先的经验和实践,靠本能在无意识中做出决策。这其实不无道理,毕竟在日常生活中我们靠的就是直觉和经验,而不是严密的数学分析。你总不至于靠A/B测试决定今天早上穿什么裤子,倘若真用的话,恐怕你这一天都出不了门了。
精益创业也面临很多批评的声音,其中之一就是过于以数据为导向。这些批评认为创业不应沦为数据的奴隶,而应将其作为工具;不应被数据牵着鼻子走,而应通过数据获取信息。之所以会出现这样的批评,大都是因为批评者太懒,还反过来为自己的避重就轻开脱。但有些时候这些人的顾虑也不无道理:滥用数据容易导致局部优化,进而忽视大局,这是极其危险乃至致命的。
考虑这样一个案例:在线旅行社Orbitz曾通过数据发现Mac用户比PC用户更有可能预订较为昂贵的酒店,其首席技术官罗杰·里欧就曾在《华尔街日报》的一篇报道中提到:“我们发现Mac用户预订四至五星级酒店或较昂贵房间的概率比PC用户高40%,而且有数据支持这一点。”1
1 http://online.wsj.com/article/5B100014240527023044586045774888225667325882.html
一方面,如果分析数据的算法忽略了某个貌似无关的数据(譬如在该例中,网站访客是否为Mac用户),就失去了一个增加营收的机会。另一方面,如果算法一味盲目地根据客户数据优化产品,置其他与销售相关联的因素于不顾,则有可能导致意料之外的结果,如糟糕的公关。单纯依靠机器,以数据为导向进行的产品优化会导致许多问题发生。
早在许多年前,数据分析巨头Omniture的前市场总监盖尔·恩尼斯就曾告诉笔者,作为其内容优化软件的客户,笔者必须坚持用人类的判断来调和机器的自动优化。如果单纯依靠Omniture公司的软件,很快就能算出,网页上衣着暴露的女人图片带来的点入率远比其他形式的内容高得多。但这样得来的高点入率只会是短期的成功,迟早会被其对品牌形象造成的损害所抵消。所以,Omniture软件的背后还有专职的内容运营人员负责在大局上把关,同时为机器的自动测试提供素材元。人类提供灵感,机器负责验证 。
在数学上,局部最大值点的定义是函数在给定邻域内最大的取值2 。也就是说,局部最大值并不是你能取到的最大值,只是在某一范围内最大。这可以类比为群山中的一汪湖水,湖水的水位并不如海平面那么低,但已然是群山中的最低点了。
2 http://wikipedia.org/wiki/Maxima_and_minima
优化的核心是找到给定函数的最大值或最小值。机器虽然具备一定寻找最优解的能力,但其解的范围不可能超过约束条件所规定的区间。这和群山中湖水的最低水位不如海平面那么低有异曲同工之妙,周围的限制导致湖水只是群山中的最低点。
为了使受到限制的优化更易理解,请想象有人给你三个车轮,并要求你制造出最好、最稳定的交通工具。在对不同车轮布局进行迭代之后,你想到了一个类似三轮车的配置。这就是最佳的三轮配置。
以数据为导向的优化在进行迭代式的产品改进方面没什么问题,问题在于它不会告诉你:“嘿!你知道吗?四个车轮比三个更好!”数学在优化已知系统方面可以做得很好,而人类更善于发现新的系统。换言之,渐进式的改变可以达到局部极限,创新则可能导致全局洗牌 。
在《伊甸园之河》(Basic Books)一书中,理查德·道金斯3 用一条流淌的河作为比喻来介绍进化。他在书中解释道,生物的进化创造出了眼这一器官。事实上,进化创造出了数十种不同的眼:黄蜂的、八足类动物的、人类的、鹰的、鲸鱼的,等等。进化的缺点是没法倒退的,只要进化到够用的程度,细微的基因突变就无法使视力得到进一步提升。人类之所以进化不出鹰那样的双眼,是因为人类视觉系统在向鹰的视觉系统衍化时会导致视力的下降,进而不会被进化所选择。
3 牛津大学生物学家。——译者注
单纯依靠机器的优化与进化具有相似的局限性。如果优化只是为了取得局部的极限,那代价可能是错失一个更大、更重要的机会。人的职责就是在数据优化的背后做个聪慧的设计者。
在我所认识的创业者中,有许多人都对完全基于数据的创业有一种天生的抵触。他们更愿意相信自己的直觉。他们不喜欢毫无灵魂、单纯机械式的优化,而是深知需要放眼更大的市场,重视正在解决的问题以及基础商业模式。
归根结底,数据是检验假设的极佳工具,除非结合人类的反思,否则很难在产生新假设方面有建树。